查看原文
其他

统计计量丨部分线性函数型系数面板数据模型的估计与Stata应用

数据Seminar 2021-06-03

Editor's Note

在回归模型中,通常使用交互项来度量交互效应。但这意味着交互效应必然是线性的,此假定在现实中有局限性。本文使用“函数型系数”(functional coefficient)的非参数方法来考察交互效应,更具一般性与稳健性。

The following article is from 计量经济学及Stata应用 Author 杜克锐




什么是部分线性函数型面板数据模型

在经济学研究中,异质性分析越来越受到大家的关注。一般而言,交互项分析主要是在线性回归模型框架下进行建模。我们用以下的面板数据模型作为例子:

其中, 是固定效应(fixed effects), 是随机误差项。以上交互项模型假设了  对的影响是 的线性函数,可以表示为:

然而,ZY 的真实影响函数很有可能不是以上的简单线性函数关系。不失一般性,我们可以将 ZY 的影响看成一个关于随机变量 U 的未知函数 ,那么回归模型可以表示为:

以上模型就是“部分线性函数型系数面板数据模型”(Partially Linear Functional-coefficient Panel Data Models)。如果允许因变量  的滞后变量进入  或者 ,则上式为“部分线性函数型系数动态面板数据模型”。
特别需要指出的是,这里我们考虑  是连续随机变量的情形。如果  是离散随机变量,也就是分类变量,则可以通过  与  虚拟变量的交互项进行分析。此外,我们也假设  是  的连续函数。



如何估计部分线性函数型系数面板数据模型
对部分线性函数型系数面板数据回归模型的估计方法主要有两种。一种是应用“核估计方法”(kernel method),厦门大学蔡宗武教授在这个方向做了很多开创性的工作。应用核估计方法来估计以上模型的一个难点如何消除固定效应。感兴趣的读者可以参阅Sun et al. (2009),他们提出了least square dummy variable (LSDV)的处理方法。
另外一种是应用“序列估计方法”(serial method),由Ang et al. (2016)和 Zhang and Zhou (2018)提出。序列估计方法其核心思想是利用一组“基函数”(basis function)的线性组合来逼近函数型系数,进而将模型转化为线性回归模型。固定效应项则可以通过差分变换来消除。模型估计的主要步骤如下:
Step 1:利用一组基函数(basis function) 的线性组合来逼近未知函数  (常用的基函数有 natural spline函数,B-Spline函数等),

原始模型可以进一步表示为:

其中,,而 
Step 2:对上式取差分消去固定效应,得到以下模型:

Step 3:通过最小二乘(least square)的方法估计得到系数向量  的估计。如果模型中存在内生变量,则可以利用两阶段最小二乘或广义矩估计的方法对系数向量进行估计。

Step 4:估计未知函数 

在一些正则条件和技术性假设下,Zhang and Zhou (2018) 证明了当横截面维度 N 趋于无穷,时间维度趋于无穷(或者 N 趋于无穷,而T 固定)时,以上估计量具有一致性和渐进正态性。



Stata命令
基于Zhang and Zhou (2018)的理论,我们写了三个Stata命令来对以上模型进行估计。这三个命令已经打包上传于GitHub网站(https://github.com/kerrydu/xtplfc_Stata),可在Stata中通过运行以下代码下载安装:
net install github, from("https://haghish.github.io/github/")github install kerrydu/xtplfc_Stata

左右滑动查看更多

其中,“github install”的作用类似于大家所熟悉的“ssc install”,只不过前者是从 GitHub 而非 SSC 的平台下载。
这三个命令还须调用“moremata”与“bspline”的命令包,可在Stata中用如下命令安装:
ssc install morematassc install bspline

左右滑动查看更多

第一个命令是关于静态面板数据模型的 xtplfc 命令,其语法如下(在Stata中输入命令 help xtplfc 即可见,帮助文件还提供了模拟数据的完整案例):
第二个命令是应用2SLS估计带有内生变量模型的 ivxtplfc 命令,其语法如下(在Stata中输入命令 help ivxtplfc 即可见,帮助文件还提供了模拟数据的完整案例):
第三个命令是关于动态面板数据模型的 xtdplfc 命令,其语法如下(安装命令后,在Stata中输入命令 help xtdplfc 即可见,帮助文件还提供了模拟数据的完整案例):



蒙特卡洛模拟
下面通过蒙特卡洛模拟来考察此方法对于非参数部分  的拟合效果。
DGP 1

设定 N =50, =40,模拟次数为500次。函数型系数  的估计结果如下图所示:
DGP 2

设定 = 50, T =40,模拟次数为500次。函数型系数  的估计结果如下图所示:
通过以上模拟分析,我们可以看到序列估计方法可以得到比较接近真实函数的估计结果。
DGP 3

设定 N =50, T =40,模拟次数为500次。与前两个数据生成过程不同,DGP 3是一个“门槛回归模型”(threshold regression model)。应用序列的估计方法,我们估计得到的  如下图所示:
我们可以看到由于  不连续,在跳跃点附近的估计是不一致的。但我们可以在图中观测到门槛的特征。



应用的例子
部分线性函数型系数模型将一些核心变量的系数设定为其他变量的函数,因此,适用于分析影响系数的决定问题。这里举的例子是我们今年发表在 China Economic Review的文章“Does market-oriented reform increase energy rebound effect? Evidence from China's regional development”。
在能源经济学中,提高能源效率是被广泛认为是实现节能的主要手段。但能源效率提升会促使厂商改变生产决策。一方面,能源效率提升,意味着能源实际价格下降,追求利润最大的厂商会改变投入要素间的比例,更多地使用能源去替代其他投入要素;另一方面,能源效率提升,将推动产品生产成本下降,在竞争性市场,产品生产成本的下降也将导致产品价格下降,增加产品的需求,进而厂商需要投入额外的能源生产更多的产品。这两个机制将促使能源效率提升的潜在节能量被部分地抵消掉。这种现象被称为“回弹效应”(rebound effect)。
在文献上,回弹效应通常用1+(能源需求对能源效率的弹性)来测度。许多文献对不同国家、地区和行业的能源回弹效应进行了测度,但很少有研究进一步分析反弹效应在地区间呈现差异的来源。进一步分析的难点在于在传统回归模型中,通常只能给出样本平均意义上的能源回弹效应值。而应用部分线性回归模型,我们可以很方便对这个问题进行解答。
我们从理论上分析了能源反弹效应的大小取决于企业经营的灵活性(operating flexibility)。然而,如何测度企业经营的灵活性仍然是较大的挑战。我们采取了间接的方法。由于中国地区市场化转型与企业经营灵活性高度相关,因此,我们可以通过对中国市场化转型与能源回弹效应进行分析。我们假设能源回弹效应是中国地区市场化程度的函数,模型识别为以下形式:

其中, 是能源回弹效应函数;是反映地区市场化程度的变量(CIM、GOV和NSOE分别是总体市场化程度指数,政府干预程度指数和非国有经济发育程度指数)。模型估计结果(如下图所示)验证了我们的研究假说:市场化转型提升了中国的能源回弹效应。




____________________________________________

参考文献

An, Y., C. Hsiao, and D. Li. 2016. Semiparametric Estimation of Partially Linear Varying Coefficient Panel Data Models. In Essays in Honor of Aman Ullah (Advances in Econometrics, Volume 36), 47–65. Emerald Group Publishing Limited.

Cai, Z., J. Fan, and R. Li. 2000a. Efficient Estimation and Inferences for Varying-Coefficient Models. Journal of the American Statistical Association 95(451): 888–902.

Cai, Z., J. Fan, and Q. Yao. 2000b. Functional-coefficient regression models for nonlinear time series. Journal of the American Statistical Association 95(451): 941–956.

Cai, Z., Y. Fang, M. Lin, and J. Su. 2017. Inferences for a Partially Varying Coefficient Model With Endogenous Regressors. Journal of Business & Economic Statistics 0(0): 1–13.

Cai, Z., and Q. Li. 2008. Nonparametric estimation of varying coefficient dynamic panel data models. Econometric Theory 24(5): 1321–1342.

Cai, Z., Q. Li, and J. Y. Park. 2009. Functional-coefficient models for nonstationary time series data. Journal of Econometrics 148(2): 101–113.

Du, K., Zhang, Y., and Q. Zhou. 2019. Estimating partially linear functional-coefficient panel data models with Stata. Working paper. 

Li, J., H., Liu, and K , Du. Does market-oriented reform increase energy rebound effect? Evidence from China’s regional development, China Economic Review, 2019,56,101304.

Sun, Y., R. J. Carroll, and D. Li. 2009. Semiparametric estimation of fixed effects panel data varying coefficient models. In Nonparametric econometric methods, 101–129. Emerald Group Publishing Limited.

Zhang, Y., and Q. Zhou. 2018. Partially Linear Functional-Coefficient Dynamic Panel Data Models: Sieve Estimation and Specification Testing. Working Paper.










►一周热文

数据呈现丨R与Office珠联璧合:如何实现R制图便捷导入PPT?

机器学习丨机器学习与统计学、计量经济学的区别与联系

统计计量丨一文读懂Stata做格兰杰因果检验命令总结

统计计量丨交互项模型的发现,究竟可信吗?

老姚专栏丨可决系数R方的阴暗面

元旦特刊 | 2020年元旦夜演:用R玩烟花,用心写代码

统计计量丨面板数据主要分析方法汇总















数据Seminar




这里是大数据、分析技术与学术研究的三叉路口




作者:陈强出处:计量经济学及Stata应用推荐:简华(何年华)编辑:青酱






    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存